iT邦幫忙

2024 iThome 鐵人賽

DAY 3
0

今天是第三天,要來介紹的是卷積神經網絡(CNN),這是一種廣泛應用在圖像處理的學習模型。它的設計靈感來自人類的視覺系統,可以有效地辨認圖像中的特徵然後進行分類。
CNN的主要組成部分包括卷積層、池化層和激活函數等。接下來,我會分成幾天來介紹這幾個是怎麼運作的~

1.卷積層(Convolutional Layer)

卷積層是CNN的核心。它通過一種叫做「卷積操作」的方法來得到輸入圖像中的局部特徵。卷積操作的過程可以簡單想成使用一個小矩陣,也就是所謂的「卷積核(Kernel)」,在圖像上滑動。
這個卷積核每次覆蓋圖像的一小塊區域,進行點積運算,就可以產生一個新的值。當整個圖像經過這個滑動運算後,就會形成一個「特徵圖(Feature Map)」。

卷積核的大小一般來說是3x3或 5x5的矩陣。
卷積核的參數(也就是權重)在訓練過程中不斷調整,用來適應不同的特徵,因此可以捕捉圖像中的紋理、邊緣、角點等重要的信息。
透過調整「步長(Stride)」和「填充(Padding)」,可以控制特徵圖的尺寸,使得網絡適應不同的輸入圖像。

明天要介紹的是激活函數!敬請期待!


上一篇
有關圖像的物件刪除~
下一篇
CNN day 2 —激活函數
系列文
用AI做圖像super resolution 或用AI做圖像中的物件消除30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言